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摘 要 近来 以 个 体 为 分 析 对 象 的 方法 日 益 受 到 研究 者 的 重视 ， 其 中 潜 类 别 和 潜 剖 面 模型 
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最 为 流行 。 研 究 者 


在 潜 类 别 和 潜 剖 面 模型 建 模 时 往往 需要 进一步 探讨 协 变量 与 潜 分 组 之 间 的 关系 ( 即 带 有 协 变 量 的 潜 类 别 模 
型 )。 例如， 哪些 变量 预测 个 体 类 别 归属 ， 以 及 个 体 的 类 别 归 属 对 结果 变量 的 预测 。 本 文 对 近年 来 研究 者 提出 
的 各 种 方法 进行 了 回顾 和 比较 。 包 括 当 结果 变量 是 分 类 变量 的 LTB 法 ; 当 结 果 变 量 是 连续 变量 时 的 BCH 和 稳 
健 三 步 法 。 在 此 基础 上 , 文章 为 应 用 研究 者 提供 了 Mplus 软件 示例 ， 并 在 最 后 对 当前 研究 存在 的 问题 和 未 来 研 


完 趋势 进行 了 简要 评价 。 
关键 词 ”个 体 中 心 方法 ; 混合 
分 类 号 B84 


传统 的 分 析 方 法 多 以 变量 为 分 析 对 象 ， 例 如 
Al 4} Nr (factor analysis，FA) 将 条 目 分 成 不 同 的 
因子 或 维度 。 近 年 来 以 个 体 为 中 心 (person- 
centered) 的 方法 逐渐 引起 心理 学 研究 者 的 兴趣 。 
其 中 潜 类 别 分析 (latent Class Analysis, LCA) 和 浴 
剖面 分 析 (Latent Profile Analysis，LPA) 是 个 体 为 
中 心 分 析 方 法 中 最 基本 也 是 最 常用 的 分 析 方 法 
(HAH, 2008; Collins & Lanza, 2010)。LCA 在 心 
理学 、 预 防 医学 、 精 神 病 学 、 市 场 营 销 、 组 织 管 
理 等 诸多 领域 已 广 为 使 用 (e.g., sei, EER, GK 
人 敏 强 , 2010)。 

通常 , 将 LCA 和 FA 作为 测量 模型 ， 因 为 两 
者 都 是 处 理 潜 变量 和 测量 指标 间 关 系 的 统计 模 
型 。 与 FA 不 同 , LCA 根据 个 体 在 观测 指标 上 的 作 
答 反 应 将 其 归 和 人 特定 的 潜 类 别 组 (latent class)。 然 
而 LCA 同 FA 一 样 , 也 可 以 进一步 拓展 , 纳入 协 


变量 (预测 变量 和 结果 变量 )。 纳入 协 变 量 的 FA 即 
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结构 方程 模型 (Structure Equation Model, SEM); 
纳入 协 变量 的 LCA 称 作 带 有 协 变量 的 潜 类 别 模型 
以 及 更 一 般 的 形式 一 一 回归 混合 模型 (Regression 
Mixture Modeling, RMM; e.g., Clark & Muthén, 
2009)。 例 如 ,考察 性 别 、 种 族 等 人 口 学 变量 对 洪 
类 别 分 组 的 影响 。 本 文 首先 对 近年 来 提出 的 处 理 
协 变 量 的 潜 类 别 模型 的 新 方法 进行 逐一 介绍 ; 
同时 以 一 个 具体 的 分 析 实 例 演示 不 同 处 理 方 法 的 
分 析 过 程 。 文 章 最 后 对 当前 研究 存在 的 问题 和 将 
来 的 发 展 趋势 进行 简要 评价 。 


1 潜 类 别 模型 


潜在 类 别 分 析 或 潜 类 别 模型 是 通过 类 别 潜 变 
量 来 解释 外 显 指标 间 的 关联 ， 使 外 显 指标 间 的 关 
联通 过 潜在 类 别 变 量 来 估计 ， 进 而 维持 其 局 部 独 
立 性 (local independence) 的 统计 方法 ( 见 图 1) (E8 
iI, 2008; Collins & Lanza, 2010), 其 基本 假设 是 ， 
外 显 变量 各 种 反应 的 概率 分 布 可 以 由 少数 互 斥 的 
潜在 类 别 变量 来 解释 ， 每 种 类 别 对 各 外 显 变量 的 
反应 选择 都 有 特定 的 倾向 ( 茸 卑 政 ，2008; Collins 
& Lanza, 2010)。 与 潜在 类 别 分 析 非 常 相似 的 是 洪 
在 剖面 分 析 ， 区 别 在 于 前 者 处 理 分 类 变量 , 后 者 
分 析 连 续 变 量 。 


作 期 刊 


:202303.09241v1 


chinaXiv 


ChinaXiv 合 作 期 干 


W: 方法 进展 与 软件 实现 2273 


图 1 LCA 和 LPA 示意 图 


可 以 从 方差 分 析 的 角度 理解 LCA。 方差 分析 
的 特点 是 将 方差 分 解 成 不 同 的 来 源 ， 和 常见 的 有 组 
间 vs. 组 内 和 被 试 间 vs. 被 试 内 。 在 LCA 中 ， 可 以 
将 方差 分 解 为 类 别 内 和 类 别 间 (Sterba, 2013)。 

根据 局 部 独立 性 假设 , 类别 内 的 任意 两 个 观 
测 指标 间 的 关联 已 通过 潜 类 别 变量 解释 ， 所 以 它 
们 之 间 已 没有 关联 。 根 据 独 立 事件 联合 发 生 的 概 
率 等 于 单独 发 生 概 率 之 积 的 原理 ,在 每 个 类 别 内 
部 ， 多 个 两 点 计 分 项 目的 联合 概率 可 以 表示 为 : 


J 
p(¥ile =k) =] [p(¥jle; =k) (1) 
jel 


上 式 中 ， 表示 个 体 i 在 指标 j 的 两 个 选项 
y=1 或 y=0 的 得 分 ,下 标 j 表 示 2 点 计 分 的 指标 ， 
c 为 潜 类 别 变量 ， 有 上 个 水 平 。 

同时 考虑 多 个 类 别 水 平时 ， 上 式 扩展 为 : 


p(¥)=>P(c=) P(e) © 


p(c =k) 表示 某 一 类 别 组 k 所 占 总 体 的 比率 ， 
亦 称 潜 类 别 概率 。 


2 带 有 协 变量 的 潜 类 别 模型 


在 应 用 研究 中 , 研究 者 往往 不 仅 关 心 将 个 体 
划分 到 特定 的 潜 类 别 组 ， 而 且 和 希望 探索 哪些 变量 
可 以 预测 个 体 的 潜 类 别 分 组 或 不 同 的 潜 类 别 分 组 
如 何 预测 重要 的 结果 变量 。 这 两 种 情况 分 别 对 应 
包含 预测 变量 (predictor variable) 的 LCA 和 包含 结 
HAF E (outcome variable 或 distal variable) 的 LCA, 
如 图 2 所 示 。 在 左 图 中 ， 类别 潜 变量 C 由 测量 指 
标 U 测量 ; 左 图 中 预测 变量 X 指向 类 别 潜 变 量 C 
的 箭头 表示 协 变量 影响 个 体 类 别 归 属 。 例 如 ， 某 
研究 试图 了 解 人 口 学 变量 对 儿童 行为 问题 潜 类 别 
归属 的 影响 , 根据 5 个 测量 儿童 行为 问题 的 指标 
将 450 名 儿童 分 成 4 个 潜 类 别 组 ( 即 潜 类 别 变量 
“问题 行为 "有 4 个 水 平 ), 然后 做 人 口 学 变量 (性 别 ， 
家 庭 经 济 地 位 和 年 龄 等 ) 对 潜 类 别 变量 的 回归 模 
型 。 在 右 图 中 ,箭头 的 方向 从 潜 类 别 变量 C 指向 


~ 


结果 变量 y, 表示 类 别 属性 (分 类 变量 ) 预 测 结果 变 
量 。 假 设 儿童 问题 行为 潜 类 别 归 属 可 能 会 影响 儿 
童 学 习 成 绩 。 由 于 成 绩 通 常 是 连续 变量 ， 所 以 此 
时 为 线性 回归 。 也 可 以 理解 为 不 同 问题 行为 类 别 
的 儿童 学 习 成 绩 存在 差异 ， 根 据 类 别 潜 变量 将 儿 
童 分 成 4 组 然后 做 方差 分 析 。 此 时 方差 分 析 和 线 
性 回归 等 价 。 

在 回归 模型 中 , 通常 是 根据 因 变 量 的 类 型 选 
择 对 应 的 回归 模型 。 左 图 中 ， 类别 变量 C 通常 有 
2 个 及 以 上 水 平 , 因此 logistic 回归 和 多 项 logistic 
回归 是 最 常见 的 分 析 模 型 。 右 图 的 回归 类 型 较为 
多 样 ， 主 要 取决 于 y 变量 的 类 型 ， 可 能 是 线性 回 
归 也 可 能 是 其 他 形式 的 回归 模型 。 下 面 的 介绍 包 
含 了 两 种 不 同 协 变 量 LCA 的 分 析 方 法 。 


图 2 回归 混合 模型 示意 图 


2.1 包含 预测 变量 的 潜 类 别 模型 

总 的 来 说 , 带 有 预测 变量 的 LCA 的 建 模 策略 
可 以 大 致 分 成 2 大 类 : 单 步 法 和 分 步 法 (三 步 法 )。 
顾名思义 ， 单 步 法 在 建 模 时 一 步 完 成 所 有 模型 ( 测 
量 和 结构 ) 参 数 估 计 ; 而 分 步 法 则 采用 逐步 建 模 的 
步骤 完成 参数 估计 。 

(DD) 单 步 法 

单 步 法 (one-step method) 在 处 理 带 有 协 变量 
的 LCA 时 ,同时 完成 潜 类 别 分 组 (测量 模型 部 分 ) 
和 协 变量 关系 建 模 (结构 模型 部 分 )。 如 果 协 变量 是 
预测 变量 ， 将 其 直接 纳入 模型 进行 分 析 ， 协 变量 
与 潜 类 别 变量 的 关系 在 LCA 分 析 中 同步 完成 。 考 
虑 协 变量 时 的 LCA 表达 式 : 


T K 
P(¥IZ,) =>P(C =z) JP(%IC =t) (8) 
t=1 k=1 


P(C =42) 为 考虑 协 变量 Z 时 ,属于 潜 类 别 t 
的 概率 , 该 值 可 通过 多 项 式 逻 辑 斯 特 回 归 获 得 
(Bakk & Vermunt, 2016): 


ett hZ 
P(C=1Z,)=+ (4) 


y e% +2,2 
s=1 


上 式 中 的 a, 和 pf 分 别 表 示 类 别 特定 的 截 距 和 


和 
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如 果 协 变量 是 结果 变量 (图 2 右 图 )， 只 需 将 
结果 变量 当 作 LCA 的 测量 指标 纳入 模型 (具体 见 
后 文 )。 然而 单 步 法 存在 如 下 几 点 不 足 (Vermunt, 2010): 

首先 ， 当 存在 较 多 协 变量 时 ， 单 步 法 的 实际 
操作 性 较 差 。 在 探索 性 研究 中 ， 由 于 缺少 相关 研 
究 或 理论 预期 , 模型 中 常常 包含 多 个 预测 变量 。 
在 单 步 法 中 , 不 同 协 变量 的 纳入 和 剔除 都 会 影响 
测量 模型 LCA) 的 结果 ， 使 得 整个 分 析 过 程 非常 
繁琐 。 

第 二 ， 模 型 建 模 困难 。 混 合 模型 建 模 过 程 中 
最 重要 也 是 最 复杂 的 问题 是 潜 类 别 个 数 的 确定 ， 
包含 协 变量 使 得 这 一 过 程 更 加 复杂 。 

第 三 , 单 步 法 在 实践 中 不 易 为 应 用 研究 者 理 
解 和 掌握 。 回 归 混 合 模型 的 逻辑 顺序 是 先 根据 
LCA 将 样本 分 组 ; 接着 以 分 组 ( 潜 ) 类 别 变量 作为 
观测 自 变量 或 因 变 量 进行 回归 分 析 ， 而 在 单 步 法 
中 这 些 过 程 是 一 步 完 成 的 , 理解 和 解释 上 较为 抽象 。 

BO, 包含 协 变量 的 LCA 模型 可 能 会 违反 混 
合 模 型 的 前 提 假 设 如 协 变 量 在 类 别 内 的 方差 相等 
或 /和 正 态 分 布 等 (Bauer & Curran, 2003)。 

由 于 单 步 法 的 上 述 困 难 和 不 足 ， 分 析 过 程 清 
晰 的 三 步 法 受到 方法 学 者 和 应 用 研究 者 的 广泛 关 
注 (e.g., Morin, Morizot, Boudrias, & Madore, 2011). 

(2) 简 单 三 步 法 

按照 大 多 数 应 用 研究 者 的 分 析 习 惯 , 在 做 混 
合 模 型 (mixture modeling)’ 分 析 时 ， 通常 根据 多 个 
测量 指标 采用 LCA 将 样本 分 成 不 同 的 潜 类 别 组 
(测量 模型 部 分 )。 然 后 将 类 别 潜 变 量 作为 观测 类 别 
变量 进行 后 续 分 析 。 常 见 的 后 续 分 析 有 : 比较 变 
量 在 潜 类 别 组 上 的 差异 (独立 样本 1 检验 或 方差 分 
析 ); 其 他 变量 预测 类 别 潜 变 量 或 类 别 潜 变 量 预测 


mz =A 
其 它 变量 。 


三 步 法 的 一 般 分 析 过 程 如 图 3 tas: (1) 进 行 
常规 的 LCA 模型 估计 ， 这 一 步 只 使 用 LCA 的 测 
量 指标 ; (2) 接 着 在 第 一 步 的 基础 上 根据 后 验 概率 
获得 个 体 的 类 别 归属 变量 即 潜 类 别 分 组 变量 ; (3) 
最 后 将 潜 类 别 分 组 变量 作为 观测 变量 (分 类 变量 ) 
连同 协 变量 进行 回归 分 析 。 

简单 三 步 法 也 称 作 最 可 能 类 别 回归 法 (Most 
Likely Class Regression; Clark & Muthén, 2009)?。 


1 混合 模型 比 LCA 和 LPA 更 具 一 般 的 形式 。 
2 根据 最 大 后 验 概率 将 个 体 分 人 到 不 同 的 潜 类 别 组 ， 然 后 
以 该 分 组 变量 进行 回归 分 析 ， 因 此 得 名 。 


这 种 方法 符合 应 用 研究 者 的 分 析 习 惯 ,在 实践 中 
广 为 使 用 。 


cua 
a) O) O 


图 3 简单 三 步 法 的 分 析 流程 


然而 三 步 法 也 存在 一 些 不 足 ， 通 常会 低估 类 
别 潜 变量 和 协 变量 的 关系 ， 分 类 误差 越 大 ， 系 数 
(EG fri i HH Gt (Bolck, Croon, & Hagenaars, 2004; 
Vermunt, 2010), LCA 分 析 的 关键 在 于 分 类 精确 
性 。 分 类 精确 性 对 于 个 体 中 心 的 方法 来 说 可 以 理 
解 为 测量 信和 度 或 测量 误差 问题 。 如 果 分 类 误差 较 
大 ， 把 不 属于 某 一 类 别 的 个 体 划分 到 该 类 别 将 会 
影响 整个 分 析 结 果 的 准确 性 。 针 对 简单 三 步 法 存 
在 测量 误差 的 问题 ， 近 年 来 研究 者 提出 了 一 些 校 
正方 法 来 减少 分 类 误差 产生 的 影响 (Bakk，Tekle， 
& Vermunt, 2013; Lanza, Tan, & Bray, 2013; Vermunt, 
2010)， 下 面 将 逐一 详细 介绍 。 

(3) 概 率 回 归 法 和 加 权 概 率 回 归 法 

这 两 种 方法 的 分 析 过 程 与 简单 三 步 法 类 似 ， 
也 是 分 成 三 步 。 具 体 来 说 ， 第 一 步 依据 观测 指标 
将 个 体 分 类 即 执行 LCA 分 析 。 第 二 步 将 个 体 的 后 
验 概 率 进 行 转换 再 做 回归 分 析 : (1) 概 率 回归 法 将 
后 验 概率 进行 对 数 转换 ， 转 换 后 的 数值 作为 结 
进行 回归 分 析 ; (2) 加 权 概 率 回 归 法 则 根据 后 验 分 
类 结果 直接 与 协 变量 进行 回归 但 采用 后 验 概率 进 
行 加 权 。 两 种 方法 都 考虑 了 分 类 的 不 确定 性 ， 与 
简单 三 步 法 相 比 回归 系数 的 结果 相对 较为 准确 ， 
但 由 于 后 验 概率 的 估计 本 身 也 是 存在 误差 的 ， 所 
以 回归 系数 的 显著 性 检验 存在 错误 结论 的 可 能 
(Clark & Muthén, 2009)。 

(4) 虚 拟 类 别 法 

LCA 根据 一 次 分 析 的 后 验 概率 将 个 体 分 组 ， 
这 种 做 法 存在 抽样 误差 的 问题 *。 虚 拟 类 别 法 
(pseudoclass method, PC 法 ) 采 用 类 似 缺 失 值 分 析 
时 使 用 的 多 重 搬 补 法 ， 从 个 体 的 后 验 概率 分 布 中 
随机 抽取 若干 个 (通常 20 次 ) 可 能 的 后 验 概 率 值 ” 
根据 每 次 的 概率 值 将 个 体 分 配 到 不 同 的 类 别 ， 然 


”这 里 类 似 参 数 估计 的 点 估计 ， 为 了 考虑 抽样 误差 的 影响 
通常 采用 区 间 估 计 。 
“因为 存在 分 类 不 确定 性 所 以 抽取 多 个 可 能 值 作为 分 类 误差 。 
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后 平均 阁 干 次 的 结果 作为 最 终 的 分 类 结果 (Wang， 
Brown, & Bandeen-Roche, 2005)。 

Clark 和 Muthén (2009) 的 模拟 发 现 ， 当 分 类 
精确 性 较 高 时 (entropy > 0.8), 该 方法 表现 较 好 :; 
然而 在 最 近 的 模拟 研究 中 发 现 , 与 稳健 三 步 法 和 
单 步 法 相 比 ， 虚 拟 类 别 法 在 同等 条 件 下 表现 最 差 
(Asparouhov & Muthén, 2014), 在 实际 应 用 中 并 
不 被 推荐 使 用 。 

(5) 稳 健 三 步 法 或 MML 法 

稳健 三 步 法 由 Vermunt (2010) 在 Bolck 等 
(2004) 的 研究 基础 上 提出 的 。 由 于 同时 采用 莫 代 和 尔 
分 配 法 和 极 大 似 然 估计 ， 因 此 又 称 作 莫 代 和 尔 极 大 
似 然 估 计 法 (Modal ML). Asparouhov 和 Muthén 
(2014) 将 其 称 作 三 步 法 (3-steps approach), 为 了 区 
分 简单 三 步 法 , 我 们 在 这 里 将 其 称 作 稳健 三 步 
法 。 分 析 步 又 同 简单 三 步 法 ， 区 别 在 于 第 二 步 考 
虑 了 分 类 误差 .而 简单 三 步 法 并 未 处 理 分 类 误 
差 。 稳 健 三 步 法 5 的 具体 分 析 步 又 如 图 4。 


Fixed according to misclassification 


Estimated 


图 4 稳健 三 步 法 分 析 流 程 图 (Asparouhov & Muthén, 2014) 


稳健 三 步 法 最 大 的 特点 是 在 第 二 步 考 虑 了 分 
类 误差 或 不 确定 性 。 假设 W 是 基于 模型 估计 的 类 
别 潜 变 量 , 与 实际 的 类 别 潜 变 量 C 并 不 完全 一 至 
(完全 一 致 时 不 存在 分 类 误差 ) 因此 存在 如 下 2 
个 分 类 不 确定 率 : 


Pac P(C c |N c) 


> P(C; = c,|U;) (5) 


G Ni=a 
Estep, C 为 类 别 潜 变 量 , N 为 根据 后 验 分 布 
概率 将 个 体 划分 到 不 同 潜 类 别 组 的 变量 (Mplus 分 
析 无 条 件 LCA 模型 时 保存 后 验 概率 后 结果 文件 
的 最 后 一 列 )，U 为 观测 指标 。 Nc 是 根据 N 将 1 


5 在 Mplus 中 , 稳健 三 步 法 有 两 种 实现 形式 : 自动 和 手动 。 
动 形 式 只 需 采 用 AUXILIARY 的 R3STEP 选项 ， 软件 
动 完成 上 述 3 步 分 析 。 手 动 形式 需要 分 别 执行 两 步 分 析 。 

第 一 步 , 单独 执行 LCA 分 析 ， 获 得 分 类 错误 率 的 对 数 形 
式 。 第 二 步 ,在 这 一 步 分 析 中 ,将 第 一 步 保 留 的 分 组 变量 N 
的 均值 固定 为 分 类 错误 率 的 对 数值 。 


体 划分 到 C1 类 别 的 数量 。 
在 Mplus 的 新 近 版 本 中 (7.2 之 后 的 版 
本 ), pc c 的 值 可 以 在 结果 输出 部 分 获得 。 随 后 可 
以 计算 “分 类 错误 率 ”: P(N =alC=c,) 即 实际 属 
于 C2 类 别 但 在 LCA 中 根据 后 验 概率 却 被 归 入 C1 
的 概率 : 
denq=P(N=G|C=c,)= aes) 
= De Pee Ne 
Ne 是 根据 N 将 个 体 分 配 到 C 的 数量 ,稳健 三 
步 法 使 用 log( gs 。 /qc ) VEN N firth C 的 权重 。 


(6) 修 正 的 BCH 法 

BCH 法 最 早 由 Bolck 等 (2004) 提 出 ， 用 于 处 
理 包 含 分 类 预测 变量 的 LCA。 该 方法 与 稳健 三 步 
法 逻辑 类 似 ， 区 别 在 于 稳健 三 步 法 的 第 三 步 的 估 
计 方 程 采 用 极 大 似 然 佑 计 ， 而 BCH 将 其 转换 成 加 
PUTA, 分 类 误差 作为 权重 。 

与 稳健 三 步 法 相 比 ，BCH 法 的 一 个 突出 优点 
是 不 会 改变 潜 类 别 的 顺序 。 洪 类别 顺序 的 改变 是 
极 大 似 然 估计 的 一 个 “副产品 ”。 由 于 ML 估计 党 
常 得 到 局 部 最 大 化 解 而 非 整体 最 大 化 解 ， 所 以 混 
合 模型 估计 通常 设置 多 个 起 始 值 ， 而 起 始 值 通常 
由 软件 随机 生成 ， 所 以 每 次 分 析 的 起 始 值 不 同 得 
到 的 潜 类 别 结果 可 能 不 同 ,， 潜 类 别 的 顺序 也 可 能 
不 同 。 尽 管 使 用 相同 的 数据 和 指标 ， 所 得 到 的 拟 
合 结果 和 类 别 数目 也 相同 ,但 类 别 潜 变 量 水 平 的 
顺序 可 能 不 同 ( 第 一 个 类 别 变 成 第 二 个 类 别 )， 
此 给 潜 类 别 分 析 带 来 很 大 的 麻烦 *。 

BCH 法 的 不 足 在 于 ， 当 类 别 距 离 很 小 以 及 小 
样本 量 时 ,类别 内 的 误差 方差 可 能 是 负 值 。 此 时 
如 果 把 类 别 内 方差 国定 相等 ， 也 可 以 获得 正确 的 
类 别 组 内 结果 变量 的 均值 (Bakk & Vermunt, 2016)。 
就 目前 的 模拟 研究 结果 来 看 ， 稳 健 三 步 法 和 
单 步 法 是 处 理 来 有 预测 变量 RMM 最 好 的 方法 。 
根据 通常 的 潜 类 别 建 模 流程 ， 首 先 确定 群体 分 类 ， 
然后 再 在 此 基础 上 做 进一步 分 析 。 稳 健 三 步 法 的 
分 析 过 程 清晰 明确 ,符合 广大 应 用 研究 者 的 分 析 
习惯 而 容易 被 接受 。 

22 包含 结果 变量 的 LCA 
总 的 来 说 , 包含 结果 变量 的 LCA 比 包含 预测 


E 在 稳健 三 步 法 分 析 中 ，Mplus 自动 监测 顺序 改变 问题 ,一 
旦 发 生 顺 序 改变 ，Mplus 将 不 报告 结果 (Asparouhov & 
Muthen, 2015)。 
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变量 的 LCA 要 复杂 一 些 ， 因 为 在 后 者 的 建 模 过 程 
中 类 别 潜 变 量 作为 因 变 量 只 存在 一 种 形式 
logistic 或 多 项 式 logistic 回归 。 但 在 包含 结果 变 
量 的 LCA 中 ,结果 变量 存在 两 种 形式 : 连续 和 类 
别 变 量 。 下 面 分 别 介绍 两 种 不 同形 式 结果 变量 的 
LCA 分 析 方 法 。 
2.2.1 ”结果 变量 是 连续 变量 

(1) 单 步 法 

结果 变量 是 连续 变量 时 ， 可 以 将 结果 变量 当 
作 LCA 模型 的 指标 ， 同 时 完成 模型 估计 。 当 局 部 
独立 性 满足 时 , LCA 表达 式 为 公式 2， 当 纳入 连续 
的 协 变量 Zia, 公式 2 改写 为 联合 的 形式 : 

了 K 
P(¥,IZ,) = > P(C =t)] [P ŒC =t) f (ZC =t) 7) 
t=1 k=1 

f(ZilX =t) 为 协 变量 Z 在 特定 类 别 内 的 分 布 ， 
连续 变量 时 为 正 态 分 布 ， 如 果 存 在 多 个 连续 变量 
则 为 多 元 正 态 分 布 。 

单 步 法 需要 满足 重要 的 前 提 : 连续 结果 变量 
在 各 类 别 内 正 态 分 布 。 如 果 正 态 假设 不 成 立 则 会 
改变 测量 模型 的 结构 及 意义 ， 例 如 高 估 类 别 数 
(Bauer & Curran, 2003)。 另 外 ， 如 果 存 在 多 个 连续 
结果 变量 则 更 加 复杂 。 假 如 采用 每 次 只 纳入 一 个 
结果 变量 的 建 模 策略 ， 则 会 产生 LCA 模型 混淆 的 
问题 : 纳入 不 同 结果 变量 间 的 LCA 模型 是 不 同 的 。 

(2)LTB 法 

Lanza 等 (2013) 最 近 提 出 了 一 种 新 的 方法 可 
以 避免 单 步 法 违反 假设 时 结果 不 准确 的 问题 ， 因 
为 这 种 方法 并 没有 特定 的 分 布 假设 ,在 LTB 法 中 ， 
首先 将 结果 变量 Z 作为 协 变量 纳入 LCA 分 析 ( 过 
程 同 包含 预测 变量 的 单 步 法 ), 流程 如 图 5。 


Analyze Calculate 


C= 


图 5 LTB 法 分 析 示 意图 


第 二 步 计 算 结果 变 
连续 变量 ) 或 概率 (类 别 变量 ): 


手 个 类 别 内 的 均值 


ben 
Ht 
时 


一 


” 自 变量 是 分 类 变量 (这 里 的 法 类 别 变量 ) 因 变量 是 连续 变 
Fà 


量 的 回归 模型 等 价 于 单 因 素 方差 分 析 。 


M = |Z f(ZIC=t) (8) 
Z 


协 变量 Z 在 特定 类 别 内 的 分 布 F(ZIX =t) 可 
通过 贝 叶 斯 定理 获得 : 


F(ZIC =t)= 


f(Z)P(C=¢Z) 
P(C=t) 
其 中 的 P(X=tzZ) 和 P(X=t) 是 条 件 概 率 和 
类 别 概率 由 第 一 步 获得 。 式 中 f(Z) AA, 
Asparouhov 和 Muthkn (2014) 建 议 使 用 Z 的 实证 分 
布 代 替 


(9) 


N = 
u -Dn (10) 

Lanza 等 (2013) 并 没有 给 出 的 标准 误 公 式 ， 
Asparouhov 和 Muthén (2014) 建 议 使 用 类 别 特 定 的 
方差 的 均 方 根除 以 类 别 特定 的 样本 量 获得 ,但 模 
拟 研 究 发 现 这 种 做 法 会 低估 标准 误 (Bakk & Vermunt, 
2016)。 随后 , Bakk, Oberski 和 Vermunt (2016) 提 出 
了 Jackknife 和 Bootstrap 再 抽样 的 标准 误 。 

当 连 续 结果 变量 的 方差 在 不 同类 别 内 相等 时 
即 同 方差 (homoskedastic errors), LTB 法 的 估计 结 
果 是 无 偏 的 ， 此 时 结果 变量 与 潜 类 别 变 量 之 间 旦 
linear-logistic 关系 。 如 果 同 方差 不 成 立即 异 方差 
(heteroskedastic errors) 时 , LTB 法 估计 类 别 特定 的 
均值 存在 偏差 (Bakk & Vermunt, 2016)。 另 外 , LTB 
方法 处 理 多 个 连续 结果 变量 时 存在 困难 ， 如 果 采 
用 分 别 建 模 的 方式 将 面临 单 步 法 同样 的 困境 。 

(3) 修 正 的 LTB 法 

针对 LTB 法 的 不 足 ，Bakk 等 (2016) 结 合 稳健 
三 步 法 的 分 析 思 想 对 LTB 法 进行 了 修正 ， 并 将 其 
分 成 三 步 实 现 ， 因 此 这 种 方法 与 稳健 三 步 法 分 析 
过 程 非常 相似 (流程 见 图 6)。 首 先 , 使 用 测量 指标 
建立 LCA, 同时 根据 后 验 概率 将 个 体 分 到 不 同 的 
潜 类 别 组 N。 第 二 步 ， 考虑 分 类 误差 的 前 提 下 通 
过 估计 潜 类 别 变量 C， 同 时 将 结果 变量 Z 作为 
协 变量 纳入 分 析 ( 稳 健 三 步 法 并 未 纳入 协 变量 )， 
RAK 11。 


P(N, =s|Z,) = yP(c =1\Z,)P(N,=sIC=t) (11) 


上 式 中 的 P(N; =s|C = t) 8 ll EY E ih 
计 的 N。 

当 连 续 结果 变量 的 方差 在 不 同类 别 内 不 相等 
时 (类 别 内 异 方 差 ), LTB 法 的 估计 结果 是 有 偏 的 。 
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Analyze Classify 


OSE 


Analyze Calculate 


ek aca 


Fixed 


图 6 修正 的 LTB 法 示意 图 


针对 此 问题 ，Bakk 等 (2016) 提 出 在 多 项 式 逻 辑 斯 


了 稳健 三 步 法 的 两 种 变 式 ( 即 类 别 等 方差 和 类 别 


特 回归 模型 中 加 入 二 次 项 (公式 12) 来 解决 估计 偏 
差 的 问题 。 


e +BZ,+y,Z; 
P(C=1z,) = a Ê: Yt ) (12) 


Dexp(o + BZ, + nze) 
tst 


(4) 修 正 BCH 法 

如 前 所 述 , BCH 法 提出 之 初 仅 用 于 分 析 包 含 
分 类 预测 变量 的 LCA, 后 来 Vermunt (2010) 对 其 
进行 了 修正 , 使 其 可 以 处 理 各 种 类 型 的 变量 。 

(5) 稳 健 三 步 法 
稳健 三 步 法 也 可 以 用 于 处 理 结果 变量 是 连续 
变量 的 LCA。 包 含 连续 结果 变量 的 LCA 模型 表 
P(N =sjZ,) -YP(c=1) f (ZIC =t) P(N =s|C =t) (13) 


t=1 


P(N=slC=t) 被 固定 为 第 二 步 估计 的 分 类 精 
确 性 参数 ，f (ZiIC =t) 通 常服 从 正 态 分 布 ,如 前 所 
述 , 结果 变量 是 连续 变量 的 LCA 的 目的 在 于 估计 
结果 变量 在 潜 类 别 不 同 水平 上 的 均值 差异 , 但 结 
果 变 量 的 方差 在 不 同类 别 组 内 可 能 相等 也 可 能 存 
在 差异 (类 似 方差 分 析 时 的 组 内 方差 同 质 假设 )。 针 
对 方差 的 不 同情 况 ,稳健 三 步 法 有 两 种 不 同 的 变 
式 : 类 别 组 内 方差 同 质 和 类 别 组 内 方差 异 质 。 

模拟 研究 发 现 (Bakk et al., 2013; Lanza et al., 
2013)， 当 满足 假设 条 件 时 ”稳健 三 步 法 , BCH 和 
LTB 均 可 以 得 到 无 偏 的 参数 估计 结果 ( 即 类 别 特 
定 的 结果 变量 的 均值 ), 然而 ， 当 条 件 不 成 立时 ( 非 
ES SARRE), 稳健 三 步 法 和 LTB 表现 较 差 ， 
而 BCH 法 则 表现 的 很 稳健 (Bakk & Vermunt, 2016)。 
Asparouhov 和 Muthén (2015) 通 过 模拟 进一步 比较 


”在 Mplus Œ, 使 用 BCH 分 析 包 含 结果 变量 RMM 时 非常 
方便 ， 只 需 一 步 即 可 实现 ， 例 句 见 表 2-8。 
”ML All BCH 假设 连续 结果 变量 在 类 别 内 的 分 布 为 正 态 分 布 。 


不 等 方差 ; 分 别 对 应 Mplus 中 的 DE3STEP 和 
DU3STEP), LTB 法 , 单 步 法 , PC 法 和 BCH 法 在 连 
续 结 果 变 量 非 正 态 ( 双 峰 分 布 ) 时 的 表现 ,结果 进 
一 步 证 实 了 BCH 的 稳健 性 (其 他 方法 表现 均 不 
佳 )。 尽 管 如 此 ， 当 类 别 距 离 或 分 类 精确 性 较 小 时 
(比如 entropy = 0.5), BCH 也 会 低估 标准 误 。 他 们 
的 结果 还 发 现 ， 当 组 内 方差 同 质 性 不 成 立时 , 方 
差 不 等 的 稳健 三 步 法 (DU3STEP) 和 BCH 法 表现 
最 佳 ， 且 前 者 更 优 。 
2.2.2 ”结果 变量 是 类 别 变量 

LTB 法 在 处 理 分 类 结果 变量 时 表现 较 好 , 不 
会 像 分 析 连 续 结果 变量 时 出 现 违 反正 态 和 方差 同 
质 假设 后 的 估计 偏差 问题 。 在 Asparouhov 和 
Muthén (2014) 的 模拟 研究 中 ,检验 了 3 个 样本 量 
(N = 200, 500 和 2000) 和 2 种 分 类 精确 性 (entropy= 
0.5 和 0.65) 下 LTB 的 表现 , 结果 发 现 仅 在 N = 200 
和 entropy = 0.5 时 才 会 出 现 明 显 的 偏差 。 
2.3 ”回归 混合 模型 方法 的 适用 情境 汇总 表 

为 了 方便 读者 对 上 述 介绍 的 各 种 方法 间 的 比 
较 和 选择 ,在 Asparouhov 和 Muthén (2015) 的 基础 
E, 表 工 汇总 了 带 有 不 同 协 变量 LCA 分 析 方 法 的 
使 用 条 件 和 简要 评价 ， 以 便 研 究 者 选用 。 


3 实例 分 析 


实例 数据 来 自 中 国人 民 大 学 2010~2011 执行 
的 北京 市 城镇 老年 人 (60~95 岁 ) 焦 虑 症状 调查 ， 有 
效 样本 量 1292”。 本 例 中 使 用 了 其 中 的 简 版 老年 
抑郁 量 表 (GDS-15) 总 分 (gds)、 生 活 自理 状况 共 16 
个 题 项 (C2A-C2Q), 选项 编码 为 :1. 不 费力 ; 2. 有 些 
困难 ; 3. 做 不 了 )、 年 龄 (连续 变量 )、“ 觉 得 自己 现 
在 老 吗 ”( 二 分 变量 , ifold) 等 题目 。 


! 参见 中 国 国家 调查 数据 库 : http://www.cnsda.org/index. 
php?r=projects/view&id=60493698。 感 兴趣 的 读者 可 以 自行 
下 载 数据 尝试 根据 附 表 相 应 代码 进行 分 析 。 
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表 1 各 种 情况 处 理 方法 汇总 表 


适用 情况 方法 Mplus tE: 评价 
Auxiliary=() 

结果 变量 分 类 单 步 法 无 单独 语句 直接 将 类 别 结 果 变 量 作为 LCA 的 测量 指标 ; 这 种 做 法 

变量 显然 会 影响 测量 模型 ; 纳入 不 同 的 结果 变量 会 造成 测 
量 模 型 结果 的 差异 ， 因 此 不 推荐 使 用 。 
LTB DCAT 是 处 理 类 别 结果 变量 最 好 的 方法 之 一 ,推荐 使 用 。 

连续 APA 无 单独 语句 非 正 态 时 表现 不 佳 。 
变量 BCH BCH 是 处 理 连续 结果 变量 最 好 的 方法 之 一 , 在 DUBSTEP 


不 报告 结果 时 使 用 。 


在 结果 变量 类 别 内 正 态 分 布 , 方差 不 等 时 表现 佳 。 但 
会 出 现 类 别 顺序 变化 的 不 足 。 


稳健 三 步 法 : 类 别 方差 不 等 DUBSTEP 


稳健 三 步 法 : 类 别 方差 相等 ”DE3STEP 在 结果 变量 类 别 内 正 态 分 布 , 方差 相等 时 表现 佳 。 
LTB DCON 对 假设 前 提 比 较 敏 感 ， 当 假设 违反 时 会 扭曲 估计 结果 ， 
不 推荐 使 用 
PC method E 精确 性 较 差 ,不 推荐 实际 使 用 
预测 变量 PC method R 结果 有 偏 ， 不 推荐 使 用 。 
单 步 法 无 单独 语句 表现 良好 ， 当 变量 较 多 时 使 用 不 便 。 
稳健 三 步 法 R3STEP 表现 良好 ,操作 方便 ,推荐 使 用 。 


下 面 通过 这 个 实例 简单 的 介绍 通过 Mplus 软 意义 , 将 两 个 类 别 分 别 命 名 为 “不 能 自理 类 ”和 “能 
件 如 何 执 行 上 述 各 变量 类 型 和 方法 。 这 里 我 们 对 AX”, 分 别 占 比 15.3% 和 84.7%。 图 7 呈现 
生活 自理 状况 量 表 进 行 潜 类 别 分 析 ， 然 后 依次 加 了 两 个 类 别 的 条 件 概率 。 


入 预测 变量 和 结果 变量 。 (2) 加 入 预测 变量 的 回归 混合 模型 
(1) 潜 类 别 分 析 在 保留 的 两 个 类 别 模型 基础 上 加 入 连续 预测 
首先 , 使 用 老年 人 生活 自理 状况 量 表 的 15 个 变量 (年 龄 )， 预测 潜 类 别 变量 , 采用 R3STEP 法 ， 


条 目 进行 潜 类 别 分 析 。 分 别 拟 合 2~4 个 类 别 。 通 相应 的 Mplus 语句 见 网 络 版 附 表 2。 

过 模型 比较 后 选择 2 个 类 别 模型 为 最 优 模型 (对 应 如 前 所 述 ， 因 变量 为 分 类 潜 变 量 ,， 这 里 的 回 
Mplus 语句 见 网 络 版 附 表 1)。 此 时 ，Entropy = 归 方 程 为 多 项 式 logistic 回归 。 软件 默认 第 2 个 类 
0.965, 提示 较 高 的 分 类 精确 度 。 根 据 条 目的 实际 别 组 为 参照 组 (reference group). 结果 表明 ( 见 网 络 


= 1.0 


Q 09 | —o— 不 能 自理 15.3% 
m A----- 能 够 自理 84.7% 


0.8 | 
0.7 4 
0.6 | 
0.54 
04 | 
03 4 
0.2 4 


A B C D E F G HI GK LM NN OP 
图 7 两 类 别 在 选项 3 上 的 条 件 概率 
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版 附 表 3) 年 龄 对 第 一 个 类 别 的 回归 系数 为 0.153， 
SE = 0.014, p < 0.001, 说 明年 龄 有 助 于 预测 老人 所 
属 的 类 别 组 。 相 对 于 第 二 类 别 组 (可 以 自理 组 )， 年 
龄 每 大 一 岁 属 于 第 一 类 别 组 (不 能 自理 组 ) 的 发 生 
比 要 高 16.5%. 

(3) 加 入 分 类 结果 变量 的 回归 混合 模型 

同样 地 ,在 保留 两 个 类 别 模型 基础 上 加 入 自 
我 感觉 “是 否 老 了 ”作为 结果 变量 。 该 变量 有 2 个 
选项 ， 所 以 采用 DCAT 法 , 语句 见 网 络 版 附 表 4。 

分 析 结 果 表 明 ( 见 网 络 版 附 表 5)， 相 比 于 生活 
自理 类 别 组 ,生活 不 能 自理 类 别 的 老人 其 “老人 
身份 认同 ”的 程度 要 高 。 有 具体 结果 是 ,生活 不 自理 
类 别 组 选择 “觉得 自己 老 了 ”的 概率 是 0.735,“ 觉 
得 自己 未 老 ” 的 概率 是 0.265; 而 生活 能 自理 组 对 
应 的 选择 是 0.435 和 0.565。 

(4) 加 入 连续 结果 变量 的 回归 混合 模型 

加 入 自 评 抑郁 得 分 作为 结果 变量 , 采用 
DCAT 法 , 语句 见 网 络 版 附 表 6。 两 个 类 别 组 抑郁 
自 评 得 分 分 别 为 :4.54 Fl 2.90, 差异 显著 (p < 0.001)。 
此 结果 表明 ( 见 网 络 版 附 表 7), 平均 来 讲 ， 生 活 不 
能 自理 的 老人 ， 抑 郁 程度 要 显著 高 于 生活 能 够 自 
理 的 老人 。 


4 ”小 结 与 展望 


总 的 来 说 ， 回 归 混 合 模型 目前 可 以 分 为 两 大 
类 别 ， 带 有 协 变 量 的 潜在 类 别 模型 和 混合 结构 广 
程 模型 。 本 文 主要 讨论 的 带 有 协 变量 的 潜在 类 别 
模型 的 最 新 研究 方法 和 软件 实现 。 针 对 带 有 协 变 
重 的 潜在 类 别 模 型 又 可 以 分 成 两 种 个 同 的 类 型 
包含 预测 变量 和 结果 变量 的 模型 。 
学 研究 来 看 ， 当 结果 变量 是 分 类 变 SE, TB 法 
是 最 佳 选 择 ; 当 结 果 变 量 是 连续 变量 时 BCH 和 稳 
健 三 步 法 是 最 佳 选 择 。 针 对 协 变量 是 预测 变量 的 
潜在 类 别 模型 时 ,稳健 三 步 法 是 最 佳 选择 。 
混合 模型 作为 潜 变 量 建 模 的 发 展 趋 势 之 一 ， 
到 目前 为 止 仍 处 在 发 展 的 初期 , 很 多 方法 都 在 探 
索 阶段 。 尽 管 已 有 少数 应 用 研究 发 表 , 但 总 体 来 
说 目前 应 用 研究 尚 不 多 。 同 样 地 ,回归 混合 模型 
作为 混合 模型 的 一 个 分 支 目 前 也 还 是 个 开放 的 研 
et nia a 而 且 更 
新 的 速度 非常 快 。 尽 管 本 文 介绍 的 都 是 最 新 的 方 
法 ,然而 需要 注意 总 的 是 ， 在 处 理 不 同 协 变量 时 所 
推荐 的 方法 都 是 小 规模 模拟 研究 的 结果 ， 尚 需 更 


H 


多 模拟 研究 验证 拓展 。 

Fy, 这些 方 法 在 处 理 实际 问题 时 可 能 存在 
一 些 问题 ， 比 如 同时 存在 预测 变量 和 结果 变量 的 
情景 。 在 实践 中 这 种 情景 还 是 非常 普遍 的 , 但 目 
前 尚未 有 合适 的 方法 。 尽 管 如 此 ， 回 归 混 合 模型 
作为 新 的 方法 为 我 们 分 析 传 统 问 题 提 供 了 新 的 视角 。 
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Regression mixture modeling: Advances in method and its implementation 
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Abstract: The person-centered methods, including latent class analysis (LCA) and latent profile analysis 
(LPA), are increasingly popular in recent years. Researchers often add covariate variables (i.e., predictor and 
distal variables) into LCA and LPA models. This kind of models are also called regression mixture models. 
In this paper, we introduce several new methods. Those methods include (1) the LTB method proposed by 
Lanza, Tan and Bray (2013) to model categorical outcome variables; and (2) the BCH method proposed by 
Bolck, Croon and Hagenaars (2004) to deal with continuous distal variables. Using an empirical example, 
we demonstrate the process of analyses in Mplus. The future directions of those new methods were also 
discussed. 


Key words: person-centered method, mixture modeling, latent class analysis, latent variable modeling, Mplus 
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附 表 1 潜 类 分 析 Mplus 语句 


Title: Lantent Class Analysis 
Data: File is older_survey.dat ; 
Variable: Names = C2A C2B C2C C2D C2E C2F C2G C2H C2I C2J C2K C2L C M 
C2N C2P C2Q ifold age gds agesq''; 
USEVARIABLES = C2A-C2Q; 
MISSING are all (-9999) ; 
CATEGORICAL = C2A-C2Q; 
CLASSES = C (2); 
Analysis: 
TYPE = MIXTURE; 
Starts = 50 3; 
PROCESSORS = 4; ”! 根 据 电 脑 情 况 指 定 
PLOT: 
TYPE = PLOT3; 
SERIES = C2A-C2Q (*); 


Savedata: 


file is older_survey.txt ; 
save is cprob; 
output: tech11 tech14; 


Miz 2 加 入 预测 变量 回归 混合 模型 的 Mplus 语句 


Title: Regression Mixture Modeling with Predictive Variable 
Data: File is older_survey.dat ; 
Variable: Names = C2A C2B C2C C2D C2E C2F C2G C2H C2I C2J C2K C2L C M 
C2N C2P C2Q ifold age gds agesq; 
USEVARIABLES = C2A-C2Q; 
MISSING are all (-9999) ; 
CATEGORICAL = C2A-C2Q; 
CLASSES = C (2); 
AUXILIARY = age (R3STEP);! 选择 稳健 三 步 法 
Analysis: 
TYPE = MIXTURE; 
PROCESSORS = 4; 
PLOT:TYPE = PLOT3; 
SERIES = C2A-C2Q (*); 
Savedata: file is older_survey.txt ; 
save is cprob; 


output: tech11 tech14; 


by 
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Mize 3 加 入 预测 变量 回归 混合 模型 输出 结果 (部 分 ) 


TESTS OF CATEGORICAL LATENT VARIABLE MULTINOMIAL LOGIS [C 
REGRESSIONS USING 
THE 3-STEP PROCEDURE 


Two-Tailed 
Estimate SE. Est/SE. P-Value 
C#1 ON 
AGE 0.153 0.014 11.219 0.000 
Intercepts 
C#1 -12.935 1.031 -12.541 0.000 


附 表 4 加 入 分 类 结果 变量 


归 混 合 模型 的 Mplus 语句 


Title: Regression Mixture Modeling with categorical outcome variable 
Data: File is older_survey.dat ; 
Variable: Names = C2A C2B C2C C2D C2E C2F C2G C2H C2I C2J C2K C2L C M 
C2N C2P C2Q ifold age gds agesq; 
USEVARIABLES = C2A-C2Q; 
MISSING are all (-9999) ; 
CATEGORICAL = C2A-C2Q; 
CLASSES = C (2); 
AUXILIARY = ifold (DCAT);! 选择 DCAT 法 
Analysis: 
TYPE = MIXTURE; 
PROCESSORS = 4; 
LRTSTARTS = 2 1 80 16; 
PLOT: 
TYPE = PLOT3; 
SERIES = C2A-C2Q (*); 
Savedata: 
file is older_survey.txt ; 
save is cprob; 
output: tech11 tech14; 


附 表 5 加 入 分 类 结果 变量 回归 混合 模型 输出 结果 (部 分 ) 


EQUALITY TESTS OF MEANS/PROBABILITIES ACROSS CLASSES 


IFOLD 
Prob S.E. Odds Ratio SETS C07500G 
Class 1 
Category 1 0.265 0.033 1.000 0.000 1.000 1.000 
Category 2 0.735 0.0337 2133 0.389 1.492 3.049 
Class 2 
Category 1 0.435 0.016 1.000 0.000 1.000 1.000 


Category 2 0.565 0.016 1.000 0.000 1.000 1.000 
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附 表 6 加 入 连续 结果 变量 


归 混 合 模 型 的 Mplus 语句 


Title: Regression Mixture Modeling with continuous outcome variable 
Data: File is older_survey.dat ; 
Variable: Names = C2A C2B C2C C2D C2E C2F C2G C2H C2I C2J C2K C2L C M 
C2N C2P C2Q ifold age gds agesq; 
USEVARIABLES = C2A-C2Q; 
MISSING are all (-9999); 
CATEGORICAL = C2A-C2Q; 
CLASSES = C (2); 
AUXILIARY = gds (BCH);! 选 择 BCH 法 
Analysis: 
TYPE = MIXTURE; 
PROCESSORS = 4; 
LRTSTARTS = 218016; ! 配 合 tech14 
PLOT: TYPE = PLOT3; 
SERIES = C2A-C2Q (*); 
Savedata: file is older_survey.txt ; 
save is cprob; 
output: tech11 tech14; 


R7 加 入 连续 结 过 变量 


回 


归 混 合 模 型 输出 结果 (部 分 ) 


EQUALITY TESTS OF MEANS ACROSS CLASSES USING THE BCH PROCEDURE 
WITH 1 DEGREE (S) OF FREEDOM FOR THE OVERALL TEST 


GDS 
Mean S.E. 
Class 1 4.540 0.211 
Class 2 2.903 0.075 
Chi-Square P-Value 


Overall test 52.233 0.000 


